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摘 要 : [目的 /意义 ] 大 规模 肉羊 冀 舍 人 工 消 毒 存在 费时 费力 、 禾 盖 不 全 和 消毒 不 彻底 的 问题 ， 为 保持 畜 舍 卫生 
和 肉羊 健康 ， 本 研究 提出 一 种 羊 场 自 劲 导 航 喷 药 机 器 人 。 [方法 ] 从 硬件 、 看 义 分 割 模型 和 控制 算法 3 个 方 而 设计 
了 自动 导航 喷 药 机 器 人 。 硬 件 部 分 包括 履带 底盘 、 摄 像 头 和 折 释 式 喷 药 装置 。 语 义 分 割 模型 部 分 通过 引入 压缩 通 
道 网 络 注意 力 (Squeeze-and-Excitation Network, SENet) 和 基于 场景 改进 的 十 字 交 叉 注 意 力 (Criss-Cross Attention, 
CCA) 模块 ， 提 出 一 种 双 注 意 力 ENet 语 义 分 割 模 型 (Double Attention ENet, DAENet) 。 在 控制 算法 方面 ， 针 对 机 器 
人 在 面 对 贫 路 时 无 法 控制 行进 方向 的 问题 ， 利 用 模拟 真实 道路 的 方法 ， 在 羊 售 外 的 道路 上 绘 出 车 道 线 ， 提 出 了 道 
路 中 心 点 识别 和 车 道 线 中 心 点 识别 两 种 算法 来 计算 机 器 人 行进 过 程 中 的 导航 点 。 为 了 实现 上 述 两 种 算法 ， 使 用 了 
i ce ed md 依靠 此 算法 实现 两 台 摄像 头 的 切换 ， JH 制 喷 药 装置 的 开关 ; 提出 了 一 种 
局 移 量 与 速度 计算 算法 控制 机 器 人 履带 左右 轮 速度 ， 实 现 对 于 机 咒 人 行走 的 控制 。[ 结 果 和 讨论 ] DAENet 模 型 在 
图 像 分 割 任务 中 的 平均 交 并 比 (Mean Intersection over Union, mloU) 达到 了 0.945 3; 摄像 头 切换 算法 测试 结果 表明 
摄像 头 的 切换 时 间 在 15 s 以 内 ， 机 器 人 能 正确 、 快 速 地 带动 喷 药 装置 的 开关 ; 中 心 点 与 偏 移 量 计算 算法 测试 的 结 
果 表 明 ， 在 处 理 多 帧 视频 流 时 ， 算 法 平均 处 理 一 帧 图 片 所 用 的 时 间 为 0.04~~0.055 s, WRI 20~24 f/s， 满 足 实际 
工作 的 实时 性 要 求 ; 羊 场 实地 的 整体 测试 结果 表明 ， 机 器 人 完成 了 两 个 羊 舍 的 自动 导航 和 消毒 任务 ， 并 日 未 碰撞 
路 边 料 槽 ， 行 进 轨 迹 偏 移 量 未 超过 0.3 m. TEO.2 m/s 的 行进 速度 下 ， 药 箱 里 的 药 液 能 够 满足 两 个 羊 舍 的 消毒 任务 。 
机 器 人 处 理 图 像 的 平均 帧 率 为 22.4 f/s， 对 于 信息 处 理 的 准确 性 和 实时 性 能 够 满足 实验 指标 要 求 。 喷 药 覆 盖 圈 舍 地 
面 超过 90%， 满 足 实验 指标 要 求 。[ 结 论 ] 本 研究 提出 的 羊 舍 自 动 导航 喷 药 机 器 人 以 语义 分 割 模 型 DAENet 为 基 
础 ， 中 心 点 识别 算法 为 核心 ,通过 与 硬件 设计 和 控制 算法 的 相互 配合 ， 能 够 在 确保 安全 性 和 实时 性 的 前 提 下 ， 实 
现在 羊 舍 内 的 自动 导航 和 全 禾 盖 喷 药 。 
关键 词 : 自动 导航 ; 喷 药 机 器 人 ; 计算 机 视觉 ; 语义 分 割 ; 注意 力 模 块 ; 中心 点 计算 ; DAENet 
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English abstract) 
051 8 栏 、 料 槽 和 水 槽 等 。 人 工 消毒 需要 较 大 的 人 工 投 


随 着 全 球 畜 牧 业 的 持续 发 展 ， 如 何 保持 养殖 场 ” 和， 且 存 在 不 稳定 性 和 局 限 性 ， 难 免 存在 消毒 
地 卫生 和 动物 健康 已 经 成 为 一 大 关注 焦点 。 肉 羊 作 EA 。 
为 卫生 敏感 的 牲畜 ， 其 健康 状态 直接 受到 养殖 环境 随 着 人 工 智 能 和 自动 化 技术 应 用 的 快速 发 展 ， 
条 件 的 影响 ， 及 时 消毒 非常 重要 。 羊 舍 内 部 面积 通 “使 用 成 本 较 低 且 能 够 克服 人 工 的 消毒 死角 问题 的 畜 
常 较 大 ， 需 要 消毒 的 部 位 较 多 ， 有 地 面 、 墙 壁 .于 。“ 禽 养殖 自动 导航 哎 药 机 器 人 成 为 了 研究 热点 ， 促 使 
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畜 禽 养殖 向 着 自动 化 、 智 能 化 、 高 效 化 、 可 持续 化 
方向 发 展 。Adams 等 ”开发 了 一 款 牧 场 环 卫 机 器 
人 ， 使 用 了 无 迹 卡 尔 曼 滤波 法 (Unscented Kalman 
Filter, UKF) 来 使 用 传感器 的 位 置 估计 来 实现 机 需 
人 的 定位 ， 使 用 UBlox 的 GPS 里 程 计 和 激光 雷达 来 
实现 机 器 人 的 自主 导航 ; Muthugala 等 “针对 畜 禽 
售 墙 体 消 毒 的 难题 ， 提 出 了 非 单 例 1 型 模糊 逻辑 系 
统 (TI-FLS) 和 非 单 例 间 隔 2 型 模糊 逻辑 系统 
(IT2-FLS) 来 实现 消毒 机 器 人 的 墙 体 跟随 ; Patel 
等 ”提出 了 一 种 消毒 机 器 人 ， 使 用 紫外 线 消 毒 技 
术 ， 保 证 机 器 人 的 消毒 范围 可 以 覆盖 360"， 采 用 
Raspberry Pig AX A St, n] IÆ AGS TIN HE 
供 导 航 和 避 障 的 功能 ; Bijay 等 ^ 提出 了 一 种 机 器 
人 的 自主 导航 系统 ， 使 用 纯 跟 踩 算 法 进行 机 器 人 的 
自主 导航 ， 矢 量 场 直方 图 用 于 机 器 人 的 避 障 ， 二 维 
激光 雷达 (Light Detection and Ranging, LIDAR) 辅 
助 机 器 人 避 障 ; Navone SF * fih f — RR3ET 2T 8 
的 自主 导航 方法 来 解决 在 遮挡 情况 下 GPS 信和 号 受阻 
的 问题 ， 使 用 RGB-D (RGB+Depth Map) 的 深度 
帧 数据 来 处 理 输出 的 分 割 掩 码 ， 对 比 了 基于 直方 图 
最 小 搜索 的 SegMin, SegMinD 和 SegZeros 方法 对 
语义 分 割 算法 精度 的 提升 程度 。 鞠 庆 等 ”开发 了 
一 种 消毒 防疫 机 器 人 ， 使 用 无 迹 卡尔 曼 滤波 法 与 二 
HE LIDAR 进行 室内 的 定位 与 建 图 。 冯 青春 等 “ 针 
对 畜 禽 舍 内 的 恶劣 环境 ， 提 出 Magnet-RFID 
(Magnet-Radio Frequency Identification) 路 径 导 航 
方法 ， 设 计 了 基于 流体 仿真 的 喷嘴 ， 并 使 用 CEFD 
(Computational Fluid Dynamics) 仿真 技术 ”基于 
Ansys Fluent 对 机 器 人 的 喷 药 效果 进行 了 仿真 。 徐 
济 双 等 "分析 了 传统 A* 算 法 的 不 足 之 处 ， 提 出 了 
一 种 改变 权 值 的 A* 算 法 ， 结合 模 糊 PID (Fuzzy 
Proportional Intergral Derivative) 进行 巡 线 控制 ， 实 
现 了 病死 冀 禽 运输 机 器 人 的 自主 路 径 规划 。 朱 立 学 
等 由 设计 了 基于 U-Net 的 导航 路 径 识别 方法 ， 用 
于 肉 饮 养殖 场 内 道路 的 分 割 ， 采 用 等 比例 法 获取 稀 
玻 的 导航 点 ， 并 将 这 些 导航 点 通过 最 小 二 乘法 拟 合 
成 直线 来 作为 机 器 人 的 导航 线 ; RE 设计 
了 一 种 基于 激光 SLAM (Simultaneous Localization 
and Mapping) 的 导航 方法 用 于 牛 场 智 能 推翻 草 机 
a ABS AES, fH T Cartographer 算 法 来 构建 
环境 地 图 ， 通 过 自 适应 MCL (Markov Clustering) 
算法 来 实现 机 器 人 的 定位 ， 并 采用 了 Dijkstra 算 法 
来 规划 机 器 人 推翻 草 的 导航 路 径 。 羊 舍 的 环境 复 
杂 ， 包 括 不 规则 的 地 形 、 泥 洗 或 多 尘 的 路 径 ， 以 及 


不 同 的 天 气 条 件 ， 为 自动 导航 喷 药 机 器 人 带 来 了 巨 
大 的 挑战 。 

为 了 解决 这 些 挑 战 ， 本 研究 提出 一 种 使 用 语义 
分 割 技术 和 中 心 点 识别 算法 的 自动 导航 喷 药 机 器 
人 ， 和 在 提供 一 个 高 效 、 全 面 且 适应 性 强 的 解决 方 
案 以 应 对 羊 伟 的 特殊 环境 需求 5。 硬件 设计 包括 
履带 式 底 盘 、 折 破 式 喷 药 装置 和 摄像 头 。 履 带 式 底 
盘 能 够 确保 设备 在 复杂 环境 中 的 耐用 性 ; Dre 
药 杆 喷 药 时 能 确保 药 液 的 喷洒 能 够 稳定 地 覆盖 整个 
HEKER, 使 用 了 两 台 摄 像 头 来 分 别 获取 羊 舍 
内 外 的 道路 场景 。 模 型 部 分 设计 了 基于 ENet 改 进 
的 轻 量 化 语义 分 割 模 型 ， 能 够 实时 、 准 确 地 分 割 出 
羊 舍 路 面 。 控 制 算 法 部 分 设计 了 道路 和 车 道 线 中 心 
点 算法 、 速 度 与 偏 移 量 计算 算法 及 摄像 头 切换 
算法 。 

1 机 器 人 硬件 设计 

1.1 底盘 设计 


履带 式 车 辆 可 以 在 狭窄 或 限制 性 的 空间 中 进行 
转弯 ， 使 用 寿命 和 维护 周期 往往 优 于 轮 式 车 辆 ， 在 
复杂 和 恶劣 的 环境 中 具有 明显 的 优势 。 机 器 人 整 车 
尺寸 (长 X 宽 XX 高 ) 为 960 mmX700 mm X 320 mm, 
底盘 高 度 为 75 mm， 履 带宽 150 mm. A EX 
120 kg， 可 载重 200 kg， 主 体 材质 为 304 不锈钢 、 
EWI. BPE RI. SRI A PER a ce VE m 
ok, ARER tr IB, IF AR L FC HZ E 
以 增强 其 强度 和 耐 磨 性 。 

履带 底盘 驱动 依靠 左右 两 个 直流 无 刷 电 机 ， 电 
机 的 额定 功率 为 785 W, HEHEH 37.5 Nm, 最 
KMC DK fü BEA 309. E EH v HU SR EE 
I, 能 够 提供 地 形 适 应 性 。 底 盘 还 配备 一 个 尺寸 
(长 X 宽 X 高 ) 为 300 mmX250 mm X 230 mm 的 内 
仓 ， 可 以 存放 电池 、 控 制 模块 和 其 他 关键 组 件 ， 使 
得 底盘 在 完成 任务 时 能 够 维持 整体 平衡 和 稳定 性 。 
履带 底盘 可 行进 的 最 高 速度 为 6.5 km/h. IE E SJ 
图 如 图 1a 所 示 ， 其 技术 特征 如 图 1b 所 示 。 


1.2 电源 和 续航 


为 了 确保 机 器 人 在 羊 场 中 持续 、 有 效 地 完成 喷 
药 工 作 ， 机 带 人 配备 一 块 48V 30 AH 的 三 元 锂电 
池 ， 整 机 功率 为 1~2 kW， 驱 动 器 型 号 为 4850， 放 
电 时 的 工作 温度 为 -10~60 *C， 充 电 时 的 工作 温度 
为 0~45 CC， 储 存 温度 为 0~35 °C. HEPES A 的 充 
电器 ， 可 以 为 电池 提供 快速 充电 。 根 据 实地 测试 和 
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b. 底 盘 技术 特征 
Al 羊 场 自 动 导 航 喷 药 机 器 人 底盘 
Fig. 1 Chassis of the automatic robot working in sheep farm 
羊 场 的 实际 需求 ， 一 次 充电 可 以 支持 机 器 人 在 羊 场 
内 完成 约 3 d 的 喷 药 工作 。 


1.3 BM A 


喷 药 系统 用 于 均匀 地 把 药 液 喷洒 到 圈 舍 各 处 。 
MARMAR ABA, KE, MAT E hE 
和 多 喷头 喷 药 杆 5 部 分 组 成 。 消 毒药 液 储 存在 药 箱 
Ho AIEA EHER AL (Polyvinyl Chlo- 
ride, PVC) ， 采 用 方形 设计 ， 其 尺寸 为 700 mmx 
400 mmX400mm (长 X 宽 X 高 )。 

水 泵 与 药 箱 相连 ， 用 以 抽取 药 箱 内 的 药 液 ， 水 
管 的 末端 连接 了 左右 两 根 多 喷头 喷 药 杆 ， 喷 药 杆 固 
定 在 伸缩 杆 末 端 。 当 不 需要 喷 酒 药 液 时 ， 电 动 推 杆 
处 于 收缩 状态 ， 水 泵 关闭 ， 伸 缩 杆 折 徐 。 在 需要 喷 
酒 药 液 时 ， 电 源 给 电动 推 杆 供 电 ， 使 其 伸展 ， 推 动 
滑 杆 在 滑 轨 上 沿 着 滑 块 运行 方向 移动 ， 使 伸缩 杆 展 
F, 水泵 开启 ， 从 药 箱 中 提取 药 液 ， 使 多 喷头 喷 药 
杆 喷 酒 药 液 ， 喷 药 装 置 折 又 状态 和 展开 状态 如 图 2 
所 示 。 

1.4 机 器 人 整体 结构 
不 锈 钢 制 成 的 外 这 和 底盘 共同 构成 了 机 器 人 的 


主体 。 药 箱 放置 在 不 锈 钢 外 壳 内 部 。 机 顺 人 的 后 部 
配备 了 一 块 屏 幕 ， 可 以 实时 监视 电脑 的 运行 后 台 。 
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b. 喷 药 装 置 展 开 状态 
图 2 羊 含 自动 导航 喷 药 机 器 人 的 喷 药 装置 
Fig.2 The spraying device of the sheep shed automatic 
navigation spraying robot 

外 壳 配 备 了 一 个 手动 /自动 转换 旋钮 。 当 旋钮 调 至 
手动 模式 时 ， 机 器 人 的 摄像 头 、 水 和 泵 等 硬件 设备 将 
全 部 关闭 ,行走 由 遥控 融 控 制 ， 当 旋钮 切换 至 自动 
模式 时 ， 机 器 人 的 导航 由 模型 和 算法 通过 串口 自动 
控制 。 喷 药 装置 固定 在 不 锈 钢 外 这 前 方 ， 用 于 喷洒 
药 液 。 两 台 摄 像 头 分 别 置 于 机 器 人 前 的 上 方 和 下 
方 , 是 其 主要 的 视觉 传感器 。 不 锈 钢 外 壳 固 定 在 机 
器 人 底盘 上 。 图 3a 为 机 需 人 结构 示意 图 ; 图 3b 展 
示 了 车 体外 壳 的 结构 设计 ; 图 3c 展 示 了 机 器 人 的 实 
物 照片 。 
2 语义 分 割 模型 

本 研究 提出 一 种 语义 分 割 道路 和 车 道 线 识 别 模 
型 。 以 2016 年 华沙 大 学 的 Paszke 等 ”提出 的 ENet 
为 基础 ， 提 出 一 种 双 注 意 力 语义 分 割 模 型 DAENet 
(Double Attention ENet) 。 该 模型 结合 基于 场景 改 
进 的 十 字 交 又 注意 力 (Criss-Cross Cross Attention, 
CCA) 和 压缩 通道 网 络 注意 力 (Squeeze-and-Exci- 
tation Network, SENet) 模块 的 优势 ， 能 够 准确 地 分 
制 出 道路 和 车 道 线 的 区 域 。 


2.1 基于 场景 改进 的 十 字 交 义 注 意 力 


长 距离 的 依赖 关系 可 以 捕获 有 用 的 上 下 文 信 
息 ， 提 高 语义 分 割 模型 的 特征 提取 能 力 ， 十 字 交 又 
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摄像 头 


EEH _ 不锈钢 外 这 


摄像 类 


a. 机 器 人 结构 示意 图 


b. 不 锈 钢 车 体外 完结 构 设 计 


Ta Be 


一 一 屏幕 


水 泵 与 水 管 


c. 机 器 人 实物 照片 


图 3 羊 伟 自动 导航 喷 药 机 器 人 整体 结构 设计 


Fig.3 The overall structural design of the sheep shed automatic navigation spraying robot 


网 络 可 以 用 高 效 的 方法 来 获取 这 些 上 下 文 信息 。 
CCA '* 模块 能 够 引入 交叉 路 径 上 以 及 周围 像素 的 
上 下 文 信息 ， 可 以 捕获 输入 特征 图 中 的 空间 关系 和 
语义 信息 。 

本 研究 在 ENet 网 络 中 加 入 CCA 模 块 ， 在 提高 
网 络 性 能 的 同时 降低 了 参数 量 和 计算 成 本 。 特 征 图 
经 过 3 个 1X1 的 卷 积 层 生 成 注意 力 网 络 所 需要 的 
Q、K、V 这 3 个 特征 ， 接 下 来 对 OQ、K 两 个 特征 进 
行 亲 和 性 (Affinity) 操作 ， 获 取 大 小 为 W X Hj 
特征 图 中 每 一 个 像素 点 与 其 他 像素 点 的 关系 ,操作 
方式 如 公式 (1) 所 示 。 

di, = Q,9,,* (1) 

XP: 0, e RC, ÆR Q 的 空间 维度 上 位 
置 u 的 特征 向 量 ; 2，, s Re ， 是 特征 图 Q 中 位 置信 
UA ETE a EO, AQ, , 相 乘 ， 获 取 到 一 个 维 
度 为 殉 + 瓦 -1 的 向 量 ， 对 @ 中 每 个 位 置 都 进行 该 
操作 ， 获 得 新 的 特征 图 d，,。 

Xf d, ,使 用 归 一 化 指数 函数 (Softmax) 操作 后 
得 到 特征 图 4， 将 其 与 特征 图 了 进行 聚合 (Aggre- 
gation) 操作 ， 如 公式 (2) 所 示 。 

H,/- X A „b, +H, (2) 


ie | 

式 中 : HH,' 表 示 输 出 特征 中 的 特征 向 量 五 ' 在 位 
置 u 的 映射 ，A, ,表示 通道 i 和 位 置 u 的 特征 值 ，5， 
表示 V 中 特征 向 量 的 集合 ; D, ,是 特征 图 V 在 位 置 
i、u 的 特征 向 量 。CCA 模块 的 网 络 结构 如 图 4 
FITZ o 

在 CCNet 中， 采用 了 重复 十 字 交 叉 注 意 力 
(Recurrent Criss-Cross Attention, RCCA) 模块 。 
CCA 模 块 仅 能 获取 本 层 特征 图 十 字 路 径 上 的 特征 而 
非 全 局 特征 ，RCCA 通 过 级 联 两 个 CCA 模 块 来 解决 


CxWxH axiegp H | 


图 4 CCA 的 网 络 结构 
Fig. 4 The network structure of CCA 


这 一 问题 ， 其 结构 如 图 5 所 示 。 在 CCA1 中， 特征 1 
可 以 获取 到 其 十 字 路 径 上 的 特征 2 和 特征 3 的 信息 ， 
在 与 之 级 联 的 CCA2 中 ， 特 征 2 能 够 获取 到 特征 1 
和 特征 4 的 信息 。 由 于 特征 1 已 经 包含 了 特征 3 的 
言 息 ， 因 此 特征 2 间接 获取 到 了 特征 3 的 信息 。 通 
过 这 种 级 联 的 方式 ， 每 个 特征 都 能 够 获取 到 全 局 的 
其 他 特征 信息 ， 从 而 提升 了 模型 的 特征 提取 能 力 。 


特征 1 特征 3 特征 1 特征 3 


= B — 


特征 2 特征 4 特征 2 特征 4 
CCA1 CCA2 


图 5 RCCA 级 联结 构 
Fig. 5 RCCA cascade structure 


然而 ，RCCA 模块 的 实际 应 用 也 存在 一 些 不 足 
之 处 。 

1) CCA 模 块 的 复杂 性 导致 其 参数 量 较 大 ， 将 
两 个 CCA 模 块 级 联 起 来 会 降低 模型 的 推理 速度 。 

2) RCCA 模块 获取 的 全 局 特征 信息 取决 于 模 
型 中 其 他 结构 输出 的 特征 ， 其 本 身 并 不 具备 获取 不 
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同 尺 度 特征 的 能 

鉴于 以 上 两 点 不 足 ， 本 研究 设计 了 一 种 新 的 结 
构 ， 称 为 上 下 文 卷 积 模块 (Context Convolution 
Module, CCM ) ， 无 需 将 两 个 CCA 模块 级 联 ， 能 够 
同时 获取 不 同 尺度 的 全 局 特征 信息 。 结 构 如 图 6 所 
示 。 该 模块 将 特征 图 分 为 3 个 分 支 : 

1) 带 有 ReLU 激活 函数 的 3X3 卷 积 ， 填充 
(Padding) 为 1， 空 洞 率 (Dilation Rate) 为 1。 

2) 带 有 ReLU 激 活 函数 的 5X5 卷 积 ， 填 充 为 

空洞 率 为 2。 

3) 带 有 ReLU 激 活 函 数 的 7X7 卷 积 ， 填 充 为 

空洞 率 为 3。 


f ReLU 


Es E ReLU cy A - 输出 


二 
特征 图 5X5 卷 积 LX MERI 


f ReLU 


图 6 CCM 的 网 络 结构 


Fig. 6 The network structure of context convolution module 


该 模块 的 设计 思想 来 源 于 空洞 空间 金字 塔 池 化 
(Dilated Spatial Pyramid Pooling, in 上 1， 引 入 了 
相互 并 行 的 空洞 卷 积 *。 

1) 3 个 分 文 使 用 3 不 尺寸 不 同 的 卷 积 核 ， 能 够 
获取 不 同 尺 度 的 特征 信息 。 

2) 3 个 分 支 使 用 不 同 采样 率 的 空洞 卷 积 并 行 采 

样 ， 能 够 使 每 个 分 支 的 感受 野 不 同 ， 以 3 个 不 同 的 
人 ， 解 决 目标 多 尺度 问题 。 

3) 将 3 个 分 支 拼接 起 来 ， 并 用 1X1 卷 积 降 维 
成 指定 的 通道 数 。 

经 过 CCM 模 块 得 到 的 特征 图 能 够 获取 长 距离 
的 依赖 关系 ， 使 网 络 捕获 不 同 尺度 的 上 下 文 信息 。 

DAENet 中 加 入 的 注意 力 模块 是 由 CCM 和 
CCA 并 行 构成 的 特征 提取 和 融合 系统 。CCM 模块 

负责 获取 不 同 尺度 的 特征 ，CCA 模 块 负责 捕 获 十字 
FEE Let AE 将 两 个 模块 的 输出 相 

能 够 获得 丰富 的 不 同 尺度 的 全 局 特征 ， 使 得 模 
a E teas ， 从 而 实现 与 RCCA fH 
似 的 效果 。 


基于 应 用 场景 改进 的 十 字 交 叉 注 意 力 模块 在 
DAENet 中 有 两 个 方面 的 作用 : 

1) 捕获 不 同 尺 度 上 下 文 信息 。CCA 和 CCM 模 
块 代替 了 ENet 阶段 1 中 的 4 层 卷 积 ， 其 中 CCM E 
块 通过 多 个 不 同 大 小 、 不 同 空 = 洞 率 的 卷 各 核 来 对 特 
征 图 进行 特征 提取 ， 能 够 捕获 不 同 尺 度 的 上 下 文 
Ho 

2) 解决 信息 损失 问题 。CCA 是 注意 力 模块 ， 
使 用 注意 力 机 制 来 计算 每 个 像素 的 注意 力 权重 ， 在 
下 采样 阶段 增强 模型 感 兴趣 区 域 的 细节 。 能 够 在 一 
定 程度 上 解决 ENet 的 信息 损失 问题 。 


2.2 基于 双 注 意 力 机 制 的 ENet 模 型 


基于 双 注 意 力 机 制 的 ENet 模 型 (Double Atten- 
tion ENet, DAENet) 将 ENet 原本 的 6 阶 结构 缩减 
为 5 阶 结构 ， 避 免 了 下 采样 的 层 数 多 于 上 采样 ， 
致 特征 图 恢复 时 的 精度 变 低 ， 同 时 精简 模型 。 其 
络 结构 如 图 7a 所 示 。 


"uiae 


rrr gh! 190.9299 
g$ Pup ba 


阶段 4 


Ban a 


9 07 $^? | 09997P 


最 大 池 化 3X3%BL IX LEB SENet 下 采样 cepe re Wtf EWER CCA CCM PR LRN 


a. DAENet 网 络 结构 
1xlxC Ixixe 


esi | (f 
EF Preset depute 


HxWxC, HxWxC HxHxC 
b. SENet 网 络 结构 
图 7 基于 双 注 意 力 机 制 的 ENet 模 型 
Fig. 7 ENet model based on dual attention 


初始 化 模块 是 基于 ENet 的 初始 化 模块 改进 。 
阶段 1 和 阶段 2 是 下 采样 模块 ;阶段 3 和 阶段 4 是 上 
采样 模块 。 假 设 输入 的 尺寸 为 512X1 024X3。 

模型 由 5 个 部 分 组 成 。 

1) 初始 化 模块 由 两 个 分 支 组 成 。 

CD 对 输入 进行 步 长 为 2 的 卷 积 。 

D 对 输入 进行 池 化 操作 。 

合并 两 个 分 支 操作 结果 的 特征 图 ， 输 入 到 压缩 
激励 注意 力 模块 (Squeeze-and-Excitation Network, 
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SENet) |) 用 于 整个 初始 化 模块 的 输出 ， 以 增强 模 
块 的 特征 表达 能 力 。SENet 结 构 如 图 7b 所 示 。 

SENet 可 以 使 初始 化 模块 能 够 自 适 应 地 增强 特 
征 表达 能 力 ， 该 模块 输出 的 尺寸 为 256X512X16。 

2) 阶段 1 由 3 个 层级 组 成 。 

D 对 特征 图 进行 连续 两 次 下 采样 来 提取 特征 ， 
下 采样 模块 采用 了 ENet 的 瓶颈 结构 ， 输 出 尺寸 为 
64X128X128 的 特征 图 。 

@) 对 特征 图 使 用 3X3 卷 积 ， 将 瓶颈 结构 的 非 
对 称 卷 积 和 空洞 卷 积 相 互 级 联 ， 以 继续 提取 特征 ， 
激活 函数 选择 ReLU 函数 。 

© 并 联 的 CCA 和 CCM 模 块 用 于 提取 上 下 文 信 
息 并 将 其 整合 ， 再 进行 下 一 步 的 卷 积 来 提取 特征 。 

3) 阶段 2 由 两 个 层级 组 成 。 

(D 在 阶段 1 结束 后 ， 为 避免 网 络 退化 ， 引 入 了 
残 差 机 制 ， 将 多 次 下 采样 的 特征 图 通过 1X1 卷 积 
后 与 阶段 1 的 输出 合并 ， 作 为 阶段 2 的 输入 。 

O 在 阶段 2 的 最 后 同样 引入 残 差 机 制 ， 将 多 次 
下 采样 的 特征 图 通过 1X1 卷 积 后 与 阶段 2 的 输出 合 
并 ， 作 为 阶段 3 的 输入 。 

阶段 2 与 阶段 1 类 似 ， 缺 少 了 下 采样 和 并 联 的 
CCA 和 CCM 模 块 ， 是 为 了 提高 网 络 的 速度 ， 减 少 
参数 量 。 

4) 阶段 3 和 阶段 4 是 上 采样 层 。 上 采样 层 通过 
最 大 反 池 化 (Max Depooling) 和 转 置 卷 积 (Trans- 
pose Convolution) 进行 上 采样 ， 并 在 输出 时 将 两 个 
分 支 相 加 ， 以 产生 最 终 的 上 采样 结果 。 

5) 全 卷 积 层 。 整 个 网 络 的 最 后 一 个 层 是 全 卷 
积 层 ， 用 来 输出 类 别 ， 输 出 尺寸 为 312X1 024X3。 


3 导航 算法 设计 
3.1 道路 与 车 道 线 中 心 点 识别 算法 


在 伪 彩 色 图 像 中 ,不 同 的 RGB 值 代表 着 不 同 
的 像素 区 域 ， 其 中 包括 道路 、 革 道 线 和 背景 。 在 这 
些 像 素 区 域 中 ， 道 路 和 车 道 线 被 视 为 机 器 人 行走 的 
区 域 。 为 了 保证 机 器 人 始终 行走 在 道路 或 车 道 线 的 
中 心 ， 导 航 的 基本 方法 是 找 出 机 器 人 前 方 道路 和 和 车 
道 线 的 中 心 点 。 通 过 持续 地 回 着 这 些 中 心 点 前 进 ， 
机 器 人 就 可 以 在 行进 过 程 中 始终 保持 在 道路 或 车 道 
线 的 中 心 位 置 ， 从 而 实现 自主 导航 7 
3.1.1 道路 中 心 点 识别 算法 

当 机 器 人 行走 在 道路 上 时 ， 说 明 机 器 人 位 于 羊 
舍 内 部 。 由 DAENet 将 道路 从 背景 中 分 离 出 来 ， 标 
记 为 特殊 的 像素 颜色 ， 生 成 伪 彩 色 图 像 。 道 路 中 心 


点 识别 算法 用 于 计算 伪 彩 色 图 像 中 道路 像素 的 中 
心 点 。 

记 图 像 的 行 数 为 R， 列 数 为 C， 道 路 像素 点 的 
集合 为 Ps， 道 路 区 域 的 行为 rows。 则 对 于 图 像 
中 所 有 行 -， 满 足 公式 (3) 和 公式 〈4)。 

re{0,1,...,R-1} (3) 

reP. È F E FOWS oad (4) 

若 图 像 中 存在 道路 区 域 ， 则 道路 区 域 的 中 间 行 
MAX (5) 所 示 。 


min (TOWS yong ) + max (TOWS oaa ) 


2 (5) 


在 中 间 行 Ms 上 ， 存 在 道路 区 域 的 列 C,, W 
道路 区 域 的 中 心 点 横 坐 标 Ce 如 式 〈6) 所 示 。 


1 
Coa=i7>¢ (6) 
Tey 2. 


式 中 : IC, FANE RK BRAY IB; c 表 示 某 一 
道路 区 域 列 的 索引 。 

道路 的 中 心 点 坐标 为 (Ca， Mona Jo 
3.1.2 车道 线 中 心 点 识别 算法 

当 机 器 人 即将 进入 车 道 线 区 域 时 ， 代 表 机 器 人 
即将 驶 出 羊 舍 。 和 车道 线 中 心 点 识别 算法 用 于 在 伪 彩 
色 图 像 中 计算 车 道 线 像素 的 中 心 点 。 

记 车 道 线 像素 点 的 集合 为 Pu.， 车 道 线 区 域 
的 行为 rowsie。 则 对 于 图 像 中 所 有 行 -， 除 满足 
公式 (3) 外 ， 还 应 满足 公式 (7)。 

re Pime => F E TOWS pne (7) 

若 图 像 中 存在 车 道 线 区 域 ， 则 车 道 线 区 域 的 中 
间 行 Mi. 如 公式 (8) 所 示 。 


min ( rows,,.) + max (TOWS jane ) 


2 (8) 


在 中 间 行 Mi。 上， 存在 车 道 线 区 域 的 列 C,,, 
则 车 道 线 区 域 的 中 心 点 横 坐 标 Ci 如 公式 (9) 
所 示 。 


1 
C use = jac (9) 


式 中 : [Cy | Xon ER 2X BAY Z; c 表 示 某 
一 车 道 线 区 域 列 的 索引 。 
道路 的 中 心 点 坐标 为 (Cs，Miue)s 


3.2 摄像 头 切换 算法 


机 需 人 在 羊 售 内 部 时 开局 喷 药 装置 ， 驶 出 羊 盒 
后 ， 即 可 关闭 喷 药 装置 。 使 用 两 台 摄 像 头 分 别 用 于 
道路 和 车 道 线 区 域 的 导航 ,摄像 头 的 切换 代表 了 机 
器 人 进出 羊 售 的 状态 。 算 法 的 具体 流程 如 下 。 

1) 当 机 咒 人 行走 在 羊 舍 内 时 ， 调 用 道路 摄 


M a = 


My. = 
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ko a! Viinear + 0.5 X Vau (13) 
2) 当 机 器 人 即将 离开 羊 舍 时 ， 切 换 成 车 道 线 i Vinear X 300 

摄像 头 。 Vina = 0.5 X Vangular (14) 
3) 当 机 器 人 再 次 回 到 羊 舍 时 ， 切 换 回 道路 摄 CO Vime X 300 

像 头 。 IP: yw 为 机 右 人 的 前 进 速度 ， 一般 为 了 使 


为 了 保证 摄像 头 切换 的 流畅 稳定 ， 设 计 如 公 
X (10) 所 示 的 方法 : 

cap = 

sleep (1) then cap0， 

cap = capl&time (lane fromcapl 20)2 T 

sleep (1) then capl, 

cap = capO&time (lane from capü = 1) 2 T 
(10) 

式 中 : 7 是 检测 到 或 检测 不 到 车 道 线 像 素 的 时 
间 ， 是 为 了 防止 由 于 误差 导致 摄像 头 在 非 预期 的 时 
间 切 换 ; sleep (1) 为 在 摄像 关切 换 时 停机 1s， 防 止 
资源 冲突 ; cap 为 当前 摄像 头 ; cap0 为 道路 摄像 头 ， 
capl 为 车 道 线 摄 像 头 。 

当 cap0 检 测 到 车 道 线 像素 的 时 间 超 过 T 时 ， 释 
放 cap0， 停机 1s 后 切换 成 capl; 反之 ， 当 capl 检 
测 不 到 车 道 线 像素 的 时 间 超 过 T 时 ,停机 1s 后 切 
换 成 cap0。 

在 羊 舍 内 道路 两 旁 存 在 圈 舍 的 情况 下 ， 机 器 人 
自动 打开 喷 药 装置 ; 羊 售 外 车 道 线路 径 上 没有 图 
舍 ， 机 器 人 自动 关闭 喷 药 装置 ， 如 式 (11) 所 示 。 

0, cap = capl 


S, - 11 
prey 1, cap = cap0 Ha 


式 中 : Spray = 0 表示 喷 药 装置 关 ，Spray = 1 
表示 喷 药 装置 开 。 


3.3 偏 移 量 与 速度 计算 算法 


将 摄像 头 获取 的 帧 用 DAENet 分 割 完 成 得 到 伪 
彩色 图 像 后 ， 调 用 中 心 点 识别 算法 ， 找 出 伪 彩 色 图 
像 中 的 所 有 的 道路 和 车 道 线 像素 ， 并 标记 出 其 中 心 
点 。 通 过 比较 道路 中 心 与 机 器 人 当前 位 置 ， 可 以 获 
得 偏 移 量 。 偏 移 量 计算 如 公式 (12) 所 示 。 

AX = Xi — Xroad (12) 

式 中 : 4x 为 偏 移 量 ; xs 为 机 器 人 位 置 的 横 坐 
ER; xu 为 道路 的 中 心 点 的 横 坐 标 。 偏 移 量 是 机 顺 
人 进行 转向 和 修正 轨迹 的 关键 参数 。 

为 了 实现 机 器 人 的 导航 ， 需 要 将 计算 得 到 的 偶 
移 量 转化 为 机 器 人 的 左轮 速度 vw 和 右 轮 速度 vj， 
如 公式 (13) 和 公式 (14) Br. 


药 液 喷 酒 均匀 ， 取 0.2~0.7 m/s; va 为 机 器 人 的 
转向 速度 ， 由 公式 (15) 计算 得 出 。 

Vangular = —KAX (15) 

式 中 : 为 增益 系数 ,，k 越 大 ， 机 器 人 转向 的 
曲率 越 小 。 

在 实际 导航 中 ， 需 要 考虑 连续 帧 的 图 像 输入 及 
机 器 人 的 连续 运动 。 对 于 机 器 人 实际 的 运动 过 程 ， 
摄像 头 获 取 的 实时 视频 流 可 以 看 作 是 连续 输入 的 n 
张 道路 或 车 道 线 的 图 片 ， 对 于 每 一 张 图 片 ， 调 用 
DAENet 分 割 模型 来 提取 每 一 帧 的 道路 和 车 道 线 的 
言 息 ， 对 生成 的 伪 彩 色 图 像 调 用 公式 (12) 计算 自 
身 偏 移 量 。 羊 舍 实 地 道路 的 坑 洼 不 平 会 导致 机 器 人 
的 行进 不 平稳 ， 会 使 每 一 帧 的 偏 移 量 有 不 同 程度 的 
波动 。 为 了 防止 机 右 人 在 羊 舍 实地 运行 的 时 候 不 断 
地 由 于 偏 移 量 的 波动 而 拌 动 ， 取 一 个 阅 值 9， 当 偏 
移 量 |Ax| < 0 时 ,将 Ax 置 0， 即 当 偏 移 量 不 大 的 时 
ik, BEILEN RA MAP Oo HMH, HAAB 
A BE E HE v, MUAT $6 BE va A B Ax ARAE 
变化 ， 所 以 机 器 人 会 继续 按照 当前 方向 行进 ， 只 有 
当 偏 移 量 超过 阔 值 2 时 才 使 其 改变 导航 方向 。 


3.4 导航 喷 药 算法 整体 设计 


DAENet 模型 通过 语义 分 割 来 实时 获取 道路 信 
息 ， 并 生成 对 应 的 伪 彩 色 图 像 ， 将 道路 信息 从 背景 
中 分 离 出 来 ， 调 用 中 心 点 识别 算法 标记 出 机 融 人 的 
行驶 路 径 。 通 过 切换 道路 摄像 头 和 车 道 线 摄 像 头 ， 
能 够 使 机 器 人 在 路 况 发 生变 化 时 及 时 切换 其 导航 方 
式 。 偏 移 量 与 速度 计算 算法 能 够 实时 计算 机 器 人 的 
偏 移 量 ， 并 将 其 转换 成 底盘 履带 轮 的 速度 来 实现 机 
器 人 的 行进 。 引 入 串口 通信 来 实现 软 硬 件 之 间 的 信 
息 传递 。 通 过 字符 表格 式 进 行 数据 传输 ， 将 机 器 人 
的 偏 移 量 、 速 度 等 关键 参数 传输 至 底盘 控制 器 。 控 
制 器 通过 字符 表 解 析 ， 提 取 数 据 并 生成 相应 指令 ， 
调整 底盘 的 左右 轮 速度 ， 实 现 精确 控制 。 整 个 系统 
工作 流程 如 图 8 所 示 。 

手动 遥控 机 器 人 到 达 羊 舍 人 口 处 ， 输 入 需要 消 
毒 的 羊 舍 数量 N， 执 行 以 下 操作 : 

1) 打开 摄像 头 0。 

2) 打开 喷 药 装置 ， 开 始 喷 药 。 
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图 8 羊 舍 自动 导航 喷 药 机 器 人 系统 的 工作 流程 


Fig. 8 The workflow of the sheep shed automatic navigation 


spraying robot system 


3) 读 取 摄 像 头 0 的 当前 帧 ， 判 断 是 否 检测 到 
车 道 线 像素 超过 3 s。 如 果 是 ， 则 说 明 机 器 人 离开 
羊 舍 ， 进 入 车 道 线 区 域 ， 关 闭 摄 像 头 0， 并 等 待 18 
后 打开 摄像 头 1， 关 闭 喷 药 装置 ;如 果 不 是 ， 则 调 
用 道路 中 心 点 识别 算法 进行 自动 导航 和 喷 药 。 

4) WRIA EA EKRAR, MANER, 
读 取 摄像 头 1 的 当前 帧 ， 并 将 计数 器 加 1。 如 果 此 
时 计数 顺 的 值 等 于 NW， 则 说 明 机 器 人 完成 了 所 有 羊 
售 的 消毒 任务 ， 机 器 人 上 自动 停机 ;如 果 计 数 带 的 值 
小 于 N， 则 继续 执行 消毒 任务 。 

5) 判断 当前 摄像 头 1 是 否 检 测 不 到 车 道 线 像 
素 超 过 3 s。 如 果 是 ， 则 说 明 机 顺 人 进入 羊 侈 内 部 ， 
即 进入 羊 舍 ， 关 闭 摄 像 头 1， 并 等 待 1s 后 打开 摄像 
头 0， 开 始 下 一 轮 循环 ， 直 至 完成 所 有 的 消毒 任务 。 


4 机 器 人 测试 与 实验 
4.1 DAENet 模 型 实验 


为 了 充分 验证 DAENet 模 型 的 性 能 ， 进 行 了 模 
型 训练 和 验证 。 实 验 人 硬件 配置 为 Intel Xeon. (R) 
CPU E5-2687W v2 3.40 GHz， 显 存 11 GB 的 GTX 
1080Ti 显卡。 实验 操作 系统 为 Ubuntu 16.04， 实 验 
软件 平台 为 Anaconda+Pycharm2021+Python3.8+ 
Xftp7， 训 练 框架 为 PaddlePaddle-gpu2.4.2。 输 入 图 
像 像素 尺寸 统一 裁剪 为 1024X512，batch size 为 4， 
调用 4 线程 一 共 训 练 10 000 次 迭代 ， 损 失 采 用 交叉 
Mei dit Fe KZŽ (Cross Entropy Loss), KMJ SEE 
减 策 略 (Polynomial Decay) 来 控制 学 习 率 更 新 的 


步 长 。 使 用 在 羊 场 实地 采集 的 4306 张 图 片 组 成 的 
数据 集 进行 模型 训练 。 

实验 结果 表明 ， 对 于 1 280x720 分 辩 率 的 图 
像 ，DAENet 的 平均 交 并 比 (Mean Intersection over 
Union, mIoU) 达到 了 0.945 3， 训 练 过 程 中 的 moU 
如 图 9 所 示 , 证 明了 其 在 图 像 分 割 任务 中 具备 较 高 
的 准确 性 。 


2 
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迭代 次 数 Iters 
注 : 浅 蓝 色 为 每 个 step 的 mIoU; 深蓝 色 线 为 平滑 后 的 曲线 。 
图 9 DAENet 模 型 训练 过 程 中 的 mlIoU 
Fig. 9 mIoU during training process of DAENet model 


4.2 摄像 头 切换 算法 测试 


将 道路 摄像 头 〈 以 下 简称 摄像 头 0) 置 于 机 器 
人 顶部 ， 距 离 地 面 1m， 角 度 为 -20°; 车 道 线 摄像 
头 〈 以 下 简称 摄像 头 0) 置 于 机 器 人 前 方 ， 距 离 地 
面 0.4m， 角 度 为 -43$"， 取 时 间 7 = 3.0。 打 开 摄 像 
头 0 与 摄像 头 1， 初 始 机 器 人 行走 在 羊 售 内 道路 上 ， 
调用 摄像 头 0， 进 行 摄像 头 切 换算 法 的 测试 。 使 用 
图 8 的 工作 流程 进行 算法 测试 。 

当 机 器 人 行驶 在 羊 舍 内 时 ， 利 用 摄像 头 0 获 取 
帧 并 调用 分 割 算法 。 通 过 OpenCV 库 函 数 ， 每 个 帧 
的 预测 结果 被 实时 地 输出 到 屏幕 上 ， 将 道路 标记 为 
RGB (0, 128, 0), ， 背 景 标记 为 RGB (128, 0, 
0). Bl 10a 展示 了 机 器 人 行驶 在 羊 售 内 道路 上 的 原 
始 摄像 头 图 像 ; 图 10b 展示 了 经 过 DAENet 分割 算 
法 处 理 后 的 效果 。 

当 机 器 人 行驶 在 羊 舍 外 时 ,切换 至 下 方 的 摄像 
3k (以 下 简称 为 摄像 涉 1)， 并 调用 分 割 算法 。 在 这 
种 情况 下 ， 标 记 了 道路 为 RGB (0,128, 0, Hse 
为 RGB (128，0，0)， 和 车道 线 为 RGB (128, 128, 
0)。 通 过 不 断 寻找 车 道 线 的 中 心 点 ， 机 器 人 在 羊 含 
外 依然 能 够 实现 精准 导航 。 图 11a 展 示 了 机 器 人 行 
走 在 羊 售 外 车 道 线 上 时 的 原始 摄像 头 图 像 ;， 图 11b 
展示 了 DAENet 分 割 算法 处 理 后 的 效果 。 
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a. 羊 舍 内 道路 原始 图 像 b. 羊 含 内 道路 分 割 图 像 
注 : 图 b 中 绿色 像素 的 RGB 为 (0,128,0) ,代表 道路 ;红色 像素 RGB 
为 (128,0,0) ,代表 背景 。 
图 10 羊 使 内 道路 中 心 点 计算 图 像 
Fig. 10 Image for calculating the center points of roads inside 
the sheep shed 


b. 羊 含 外 车 道 线 分 割 图 像 


a. 羊 舍 外 车 道 线 原 始 图 像 
注 : 图 b 中 绿色 像素 的 RGB 为 (0,128,0) ,代表 道路 ;黄色 像素 RGB 
为 (128,128 ,0) ,代表 车 道 线 。 
图 11 羊 舍 外 车 道 线 中 心 点 计算 图 像 
Fig. 11 Image for calculating the center points of lane lines out- 
side the sheep shed 


从 实验 结果 中 可 以 看 出 ， 当 路 况 发 生变 化 时 ， 
机 器 人 能 正确 地 切换 道路 摄像 头 与 车 道 线 摄像 头 。 


4.3 中 心 点 与 偏 移 量 计算 算法 测试 


为 验证 中 心 点 与 偏 移 量 计算 算法 的 实际 计算 效 
JR. 将 训练 好 的 分 割 模型 DAENet 部 署 在 NVIDIA 
Jetson Xavier NX 计算 机 端 ， 将 该 计算 机 端 鹏 入 到 
机 器 人 系统 中 ， 调 用 分 割 模型 ， 取 vi 202, k= 
0.000 4。 为 保证 算法 的 容错 性 ， 使 机 器 人 行走 过 程 
中 在 偏 移 量 较 小 时 不 会 产生 较 大 摆动 ， 设 置 当 
-20<Ar<20 时 ， 取 Ax = 0。 开 启 摄像 头 0， 使 用 
OpenCV 将 分 制 的 结果 展示 在 屏幕 上 ， 模 型 将 摄像 
头 获 取 到 的 帧 分 割 为 伪 彩 色 图 像 ， 其 中 绿色 (RGB 
为 (0，128，0) ) 代表 道路 ， 红 色 (RGB 为 
(128, 0, 0) ) 代表 背景 。 调 用 道路 中 心 点 识别 算 
法 ， 计 算出 所 有 绿色 像素 即 道路 的 中 心 点 ， 并 用 和 白 
色 像 素 标记 在 图 上 ， 计 算 该 中 心 与 图 像 中心 的 偏 移 
量 ， 如 图 12 所 示 。 

对 于 连续 的 视频 帧 ， 取 连续 的 8 帧 图 片 ， 同 步 


图 12 羊 舍 道路 分 割 结果 
Fig. 12 Results of road segmentation in the sheep shed 


输出 每 一 帧 的 处 理 时间 、 帧 数 与 实时 的 偏 移 量 ， 输 
出 结果 如 表 1 所 示 。 
表 1 羊 舍 道 路 分 割 过 程 连续 视频 帧 的 处 理 时 间 、 帧 率 与 实时 
偏 移 量 
Table 1 Processing time, frame rate, and real-time offset for 
continuous video frames in the process of road segmentation in 
the sheep shed 


帧 序号 处 理 时 间 /s 帧 率 /(f/s) 偏 移 量 /像素 
1 0.044 9 22.4 53 
2 0.042 9 23.3 29 
3 0.049 5 20.2 -21 
4 0.047 9 20.9 0 
5 0.054 8 20.2 35 
6 0.049 9 20.0 0 
7 0.046 9 21.3 0 
8 0.046 3 21.6 0 


经 过 实验 结果 的 分 析 ， 偏 移 量 在 随 着 摄像 头 获 
取 到 的 帧 的 不 同 而 变化 。 在 处 理 多 帧 视频 流 时 ， 平 
均 处 理 一 帧 图 像 所 用 的 时 间 为 0.04~0.055 s, Wi% 
为 20~24fs， 可 以 满足 实际 工作 的 实时 性 。 


4.4 机 器 人 在 羊 场 的 整体 测试 


4.4.1 实验 环境 

实验 场地 位 于 安徽 省 皇 阳 市 临 泉 县 绿 滋 牧 业 发 
展 有 限 公 司 。 该 养殖 场 总 共 包 含 12 个 羊 舍 ， 每 两 
个 羊 舍 之 间 相 互 平行 ， 距 离 为 15 m。 整 个 羊 场 约 有 
5 000 头 湖 羊 。 每 个 羊 侈 中 间 设 有 一 条 过 道 ， 过 道 
的 路 面 为 水 泥 路 ， 表 面 凹 凸 不 平 ， 部 分 路 面 上 有 杂 
草 和 羊 疮 。 羊 舍 过 道 两 侧 分 别 设 置 有 圈 含 E 
近 过 道 的 位 置 是 料 槽 ， 工 人 使 用 电动 上 料 车 定期 对 
羊 进 行 喂食 。 本 实验 地 设置 为 连续 的 两 个 相互 平行 
的 羊 舍 ， 完 成 喷 药 工作 需要 经 过 两 条 直路 及 一 个 弯 
路 ， 共 约 140 m 的 长 度 。 羊 舍 道 路 环境 如 图 13a 所 
示 ; 料 槽 情况 如 图 13b 所 示 ; 弯路 的 车 道 线 如 图 
13c 所 示 。 
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a. 羊 含 道路 


4.4.2 ”实验 评价 指标 

精度 指标 。 实 验 中 要 求 语 义 分 制 模型 的 mIoU 
达到 90% 以 上 。 

帧 率 指标 。 帧 率 反 映 了 语义 分 割 算 法 处 理 摄像 
头 帧 的 速度 ， 包 括 获 取 图 像 信息 、 调 用 中 心 点 识别 
算法 标记 导航 点 的 整个 过 程 FE PSK AY Ht 
率 为 30 Wfs， 要 确保 实时 分 割 的 要 求 ， 帧 率 通常 不 
应 低 于 20 fis. 

可 靠 性 指标 。 实 验 中 考虑 伸缩 杆 展开 与 折 县 、 
喷 药 杆 打开 与 关闭 的 时 间 ， 在 切换 摄像 头 的 过 程 中 
加 入 了 13 s 的 容错 时 间 "中 。 为 进一步 提高 容错 性 ， 
考虑 机 械 元 件 启动 时 间 以 及 软件 切换 时 间 ， 要 求 路 
况 发 生变 化 时 ， 从 摄像 头 切换 到 喷 药 装置 完全 动作 
的 时 间 不 超过 15 s。 

稳定 性 指标 。 机 器 人 在 行驶 过 程 中 应 确保 不 触 
及 道路 边缘 、 不 发 生 碰 撞 并 且 无 发 生 碰 撞 的 趋 
势 拉 。 具 体 评估 标准 是 机 器 人 行进 过 程 中 不 碰撞 
料 槽 ， 且 相对 于 道路 或 车 道 线 的 中 心 线 偏 差 不 超 过 
0.3 m; 

消毒 效果 指标 。 为 了 评估 喷 药 覆盖 疾 舍 地 面 的 


a. 羊 舍 内 实验 过 程 


EE IP 
图 13 羊 舍 自 动 导航 喷 药 机 器 人 的 测试 环境 


Fig. 13 Test environment for sheep shed automatic navigation spraying robot 


效果 ， 要 求 药 液 履 盖 率 达到 90% 以 上 。 


b. 羊 舍 外 实验 过 程 
图 14 自动 导航 喷 药 机 器 人 实验 过 程 
Fig. 14 Automatic navigation and spraying robot during test 
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4.4.3 ”实验 过 程 

将 机 器 人 的 药 箱 注 满 药 液 ， 手 动 遥 探 自动 导 航 
喷 药 机 器 人 移动 到 第 1 个 羊 舍 入 口 。 机 器 人 开机 ， 
设置 机 避 人 自动 行进 速度 为 0.2 m/s， 调 用 程序 。 初 
始 情况 设置 摄像 头 0 开 启 ， 摄 像 头 1 关闭 ， 机 器 人 
开始 行走 ， 屏 幕 上 同步 打印 左右 轮 速度 ， 以 实时 监 
控 机 器 人 状态 。 将 每 一 帧 的 FPS 写 和 日志， 以 便 在 
实验 结束 时 计算 机 器 人 运行 时 的 平均 FPS。 机 器 人 
在 第 1 个 羊 舍 入 口 开 机 作为 实验 开始 ， 离 开 第 2 个 
羊 舍 作 为 实验 结束 。 实 验 中 观察 机 器 人 是 否 能 够 安 
全 行驶 。 使 用 特殊 标记 物 来 标记 机 器 人 行进 时 的 路 
线 。 实 验 结束 后 测量 标记 物 相 对 于 道路 中 心 线 或 车 
道 线 中 心 线 的 偏差 .计算 最 大 偏差 、 最 小 偏差 、 平 
均 偏 差 与 标准 偏差 。 记 录 从 切换 摄像 头 到 喷 药 装置 
完全 动作 所 用 的 时 间 。 实 验 后 查看 平均 帧 率 及 圈 舍 
地 面 药 液 的 覆盖 面积 。 机 器 人 在 羊 舍 内 外 的 实验 过 
程 如 图 14a 和 14b 所 示 ; 机 器 人 运行 时 屏幕 展示 如 
图 14c 所 示 。 


c. 实 验 过 程 屏 幕 展 示 
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44.4 实验 结果 

在 实验 过 程 中 ， 机 融 人 完成 了 两 个 羊 侈 的 目 动 
导航 和 消毒 任务 。 在 0.2 m/s 的 行进 速度 下 ， 药 箱 里 
的 药 液 能 够 满足 两 个 羊 舍 的 消毒 任务 。 路 况 发 生变 
化 时 ， 从 摄像 头 切 换 到 喷 药 装置 完全 动作 的 时 间 不 
超过 15 s。 记 录 了 3 次 摄像 头 切换 的 时 间 ， 如 表 2 
所 示 。 

表 2 羊 舍 自动 导航 喷 药 机 器 人 的 喷 药 控制 时 间 

Table 2 Spray control time for the sheep shed automatic 


navigation spraying robot 


切换 启 喷 药 装置 时 间 /s ”关闭 喷 药 装置 时 间 /s 
第 1 次 14.2 11.0 
第 2 次 14.1 11.2 
第 3 次 14.1 10.9 
测量 了 机 占 人 行进 路 线 和 中 心 线 之 间 的 偏差 。 


对 机 器 人 的 横向 偶 差 进行 统计 分 析 ， 计 算 了 最 大 侦 
差 、 平 均 偏 差 和 标准 偏差 。 

最 大 偏差 是 在 一 次 实验 中 机 带 人 的 最 大 横向 偏 
差 。 平 均 偏差 是 所 有 偏差 量 的 平均 值 。 标 准 偏差 是 
所 有 偏差 量 相对 于 平均 值 的 离散 程度 的 度量 ， 它 代 
表 机 器 人 行进 的 稳定 性 ， 标 准 侦 差 越 小 ， 说 明 机 天 
人 行进 的 稳定 性 越 高 。 记 录 如 表 3 所 示 。 

X3 羊 舍 自 动 导航 喷 药 机 器 人 行进 的 横向 偏差 

Table3 Lateral deviation of the sheep shed automatic 


navigation spraying robot 


m" 横向 偏差 /m 
实验 次 数 = 
最 大 偏差 ” 最 小 偏差 ” 平均 偏差 ”标准 偏差 
1 0.250 0.160 0.215 0.014 7 
2 0.290 0.200 0.245 0.0403 
3 0.290 0.170 0.221 0.045 6 


对 表 3 的 统计 数据 的 分 析 结 果 表 明 ， 机 器 人 行 
进 的 横向 偏差 不 超过 0.3 m, 平均 偏差 为 0.2 m~ 
0.5 m， 标 准 偏差 为 0.01~0.05。 行走 的 稳定 性 可 以 


满足 实验 指标 要 求 。 
实验 后 查看 日 志 ， 计 算出 机 器 人 行进 时 的 帧 率 
为 22.4 fils. 


通过 观察 ， 几 乎 完全 覆盖 羊 舍 地 面 ， 履 盖 率 超 
过 90% ， 如 图 15 所 示 。 喷 药 消毒 效果 达到 实验 指标 
要 求 。 
5 结 论 


-H 
本 研究 设计 了 一 个 基于 语义 分 割 技术 、 以 中 心 
点 识别 算法 为 核心 ， 并 搭载 折 县 式 喷 药 装置 的 羊 售 


b. 喷 药 后 圈 舍 情况 
图 15 羊 全 自动 导 航 喷 药 机 器 人 的 喷 药 效果 
Fig. 15 Spraying effectiveness of the sheep shed automatic 


a. 喷 药 前 圈 舍 情况 


navigation spraying robot 

自动 导航 喷 药 机 需 人 。 经 过 实地 测试 ， 得 出 以 下 
结论 。 

1) 通过 引入 SENet 和 基于 场景 改进 的 CCA 注 
意 力 模块 ， 提 出 了 一 种 基于 ENet 的 语义 分 割 模型 
DAENet， 进 行 以 道路 和 车 道 线 为 目标 的 羊 售 道路 
分 割 任务 。 模 型 的 mIoU 达到 了 0.945 3， 证 明了 其 
在 图 像 分 割 任务 中 具备 较 高 的 准确 性 。 设 计 了 道路 
中 心 点 识别 和 和 车道 线 中 心 点 识别 两 种 算法 来 计算 机 
器 人 行进 过 程 中 的 导航 点 。 设 计 了 偏 移 量 与 速度 计 
算 算 法 ， 在 得 到 道路 中 心 点 之 后 ， 计 算 其 对 于 自身 
位 姿 的 偏 移 量 ， 通 过 该 偏 移 量 计算 底盘 左右 轮 的 速 
度 。 设 计 了 摄像 头 切换 算法 ， 使 机 器 人 在 羊 仿 内 外 
分 别 使 用 两 台 不 同 的 摄像 头 ， 实 现 了 摄像 头 的 稳定 
切换 ， 并 依靠 摄像 头 的 切换 控制 喷 药 装置 的 开关 。 

2) 在 羊 场 实 地 测试 中 ， 机 器 人 完成 了 两 个 羊 
舍 的 自动 导航 和 消毒 任务 。 实 验 中 ， 机 器 人 未 碰撞 
路 边 料 槽 ， 相 对 于 道路 和 车 道 线 中 心 线 偏 移 量 均 不 
超过 0.3 m。 在 0.2 m/s 的 行进 速度 下 ， 药 箱 里 的 药 
液 能 够 满足 两 个 羊 舍 的 消毒 任务 。 路 况 发 生变 化 
时 ， 从 摄像 头 切 换 到 喷 药 装置 完全 动作 的 时 间 不 超 
过 15 s。 机 器 人 运行 的 平均 帧 率 为 22.4 Vs， 对 于 信 
息 的 处 理 准确 和 实时 性 能 够 满足 实验 指标 要 求 。 通 
过 观察 ， 机 器 人 喷 药 的 覆盖 率 超 过 90%， 达 到 实验 
指标 要 求 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
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Automatic Navigation and Spraying Robot in Sheep Farm 
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Abstract: 

[Objective] Manual disinfection in large-scale sheep farm is laborious, time-consuming, and often results in incomplete coverage and 
inadequate disinfection. With the rapid development of the application of artificial intelligence and automation technology, the auto- 
matic navigation and spraying robot for livestock and poultry breeding, has become a research hotspot. To maintain shed hygiene and 
ensure sheep health, an automatic navigation and spraying robot was proposed for sheep sheds. 

[Methods] The automatic navigation and spraying robot was designed with a focus on three aspects: hardware, semantic segmentation 
model, and control algorithm. In terms of hardware, it consisted of a tracked chassis, cameras, and a collapsible spraying device. For 
the semantic segmentation model, enhancements were made to the lightweight semantic segmentation model ENet, including the addi- 
tion of residual structures to prevent network degradation and the incorporation of a squeeze-and-excitation network (SENet) attention 
mechanism in the initialization module. This helped to capture global features when feature map resolution was high, addressing preci- 
sion issues. The original 6-layer ENet network was reduced to 5 layers to balance the encoder and decoder. Drawing inspiration from 
dilated spatial pyramid pooling, a context convolution module (CCM) was introduced to improve scene understanding. A criss-cross 
attention (CCA) mechanism was adapted to acquire context global features of different scales without cascading, reducing information 
loss. This led to the development of a double attention enet (DAENet) semantic segmentation model was proposed to achieve real- 
time and accurate segmentation of sheep shed surfaces. Regarding control algorithms, a method was devised to address the robot's dif- 
ficulty in controlling its direction at junctions. Lane recognition and lane center point identification algorithms were proposed to iden- 
tify and mark navigation points during the robot's movement outside the sheep shed by simulating real roads. Two cameras were em- 
ployed, and a camera switching algorithm was developed to enable seamless switching between them while also controlling the spray- 
ing device. Additionally, a novel offset and velocity calculation algorithm was proposed to control the speeds of the robot's left and 
right tracks, enabling control over the robot's movement, stopping, and turning. 

[Results and Discussions] The DAENet model achieved a mean intersection over union (mIoU) of 0.945 3 in image segmentation tasks, 
meeting the required segmentation accuracy. During testing of the camera switching algorithm, it was observed that the time taken for 
the complete transition from camera to spraying device action does not exceed 15 seconds when road conditions changed. Testing of 
the center point and offset calculation algorithm revealed that, when processing multiple frames of video streams, the algorithm aver- 
ages 0.04 to 0.055 per frame, achieving frame rates of 20 to 24 frames per second, meeting real-time operational requirements. In field 
experiments conducted in sheep farm, the robot successfully completed automatic navigation and spraying tasks in two sheds without 
colliding with roadside troughs. The deviation from the road and lane centerlines did not exceed 0.3 meters. Operating at a travel 
speed of 0.2 m/s, the liquid in the medicine tank was adequate to complete the spraying tasks for two sheds. Additionally, the time tak- 
en for the complete transition from camera to spraying device action did not exceed 15 when road conditions changed. The robot main- 
tained an average frame rate of 22.4 frames per second during operation, meeting the experimental requirements for accurate and real- 
time information processing. Observation indicated that the spraying coverage rate of the robot exceeds 90%, meeting the experimen- 
tal coverage requirements. 

[Conclusions] The proposed automatic navigation and spraying robot, based on the DAENet semantic segmentation model and center 
point recognition algorithm, combined with hardware design and control algorithms, achieves comprehensive disinfection within 
sheep sheds while ensuring safety and real-time operation. 
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